ردیابی شی در تصاویر ویدیویی

thesis
abstract

بینایی ماشین با ترکیب روش های مربوط به پردازش تصویر و ابزارهای یادگیری ماشینی، رایانه را قادر به درک هوشمند معنا و محتوای تصاویر می کند. ردیابی شی یک عمل اساسی برای بسیاری از کاربردهای سطح بالای بینایی ماشین مانند بازشناسی براساس حرکت، نظارت خودکار، نمایه گذاری فایل های ویدیویی، ارتباطات متقابل انسان و رایانه، نظارت ترافیکی و هدایت وسایل نقلیه است که امروزه در بالاترین سطح توجه خود قرار دارد. در این پایان نامه الگوریتمی کارا جهت ردیابی شی در تصاویر ویدیویی با استفاده از ویژگی های رنگ و بافت و به کمک دو شبکه عصبی توابع اساسی شعاعی ارائه شده است. در روش پیشنهادی ابتدا ناحیه ی شی توسط کاربر در فریم اول مشخص می گردد. سپس ناحیه ای هم مساحت با آن و در اطراف آن بعنوان زمینه در نظر گرفته می شود. پس از آن ویژگی های رنگ و بافت از نواحی شی و زمینه استخراج شده و به شبکه عصبی توابع اساسی شعاعی اول آموزش داده شده و آزمایش می شود. خروجی شبکه عصبی اول تصویر دودویی خواهد بود که در آن شی از زمینه ی اطرافش بطور دقیقی جدا شده است. سپس ویژگی های رنگ و بافت ناحیه ی دقیق زمینه ی بدست آمده از مرحله ی قبل گسترش داده می شود تا بتواند در برابر تغییرات زمینه در فریم های بعدی مقاوم گردد. در ادامه از ویژگی های شی و زمینه ی گسترش داده شده برای آموزش شبکه ی عصبی توابع اساسی شعاعی دوم استفاده می گردد. از شبکه عصبی توابع اساسی شعاعی آموزش داده شده ی دوم بعنوان یک تابع امتیاز دهی استفاده می گردد که مقادیر بیشتر در آن بیانگر بالاتر بودن احتمال تعلق آن پیکسل به شی است و از آن برای تشخیص پیکسل های شی در فریم بعد استفاده شده است. در روش پیشنهادی از مرکز ثقل شی و پروسه ی جابجایی میانگین برای مکان یابی شی استفاده شده است. از آنجا که بافت و رنگ شی و پس زمینه در طول ردیابی و در فریم های بعدی یکسان باقی نخواهد ماند با معرفی و سنجش معیارهایی تغییرات در مدل و اندازه ی شی بروز رسانی می گردد. نتایج بدست آمده بیانگر این است که روش پیشنهادی قابلیت ردیابی مطمئن شی را با دوربین متحرک و با وجود پوشیدگی های جزئی شی و تغییرات تدریجی در رنگ و بافت شی و زمینه خواهد داشت و تغییرات در اندازه ی شی را نیز بخوبی جبران می کند. همچنین نتایج بیانگر این است که روش پیشنهادی عملکرد بهتری در مقایسه با روش های جابجایی میانگین و تطابق قالب دارد. علاوه بر این، روش پیشنهادی ناحیه ی اشغال شده در هر فریم توسط شی را فراهم می کند که از آن می توان در پردازش های مرتبه بالاتر مانند تشخیص، تعبیر و تفسیر نوع رفتار شی و نظایر آن استفاده نمود.

similar resources

ردیابی شی های متعدد در تصاویر ویدیویی با استفاده از الگوریتم کرم شب تاب

بیش از سه دهه است که در زمینه ردیابی شی تحقیقات متعددی صورت گرفته است. اما با معرفی کاربرد¬های جدید برای این شاخه از بینایی ماشین رویکرد¬های مختلفی برای آن معرفی شده است. پژوهش صورت گرفته در این پایان نامه منجر به ارائه یک روش جدید برای ردیابی چندین شی به صورت همزمان شده است. در ساختار ردیاب پیشنهادی، از الگوریتم fsim، برای استخراج مدل اشیا استفاده شده است. اشیا قبلا بصورت ساده و توسط اشکال ساد...

رخدادکاوی در دنباله تصاویر ویدیویی مبتنی بر مدلسازی شی

یکی از موضوعات مطرح در حوزه ی پردازش تصویر و ویدئو در دهه گذشته، ردیابی و تشخیص نوع رفتار اشیا متحرک می باشد. توانایی استخراج اشیا متحرک و ردیابی آن در یک دنباله ی ویدئو، اولین گام در تحلیل ویدئوهای نظارتی است. روش های زیادی در خصوص اشیا متحرک و ردیابی آن ها مطرح شده است. روش رایج تشخیص اشیا متحرک، تفاضل پس زمینه است. از چالش های مطرح در حوزه ی ردیابی، می توان وجود اشیا مشابه در پنجره ی جستجو، ...

ردیابی لب و لب خوانی بااستفاده از پردازش تصاویر ویدیویی

لب خوانی از سالیان پیش یکی از موضوعات و ابزارهای مهم برای افراد کم شنوا و ناشنوا بوده تا این افراد درک مناسبی نسبت به گفته های شخصی که در حال صحبت کردن است داشته باشند. اخیر? لب خوانی با استفاده از تصاویر ویدیویی (تصاویر متوالی) یکی از موضوعات مورد علاقه محققان بوده که طی چند دهه اخیر تحقیقات گسترده ای راجع به این مساله انجام داده و مقاله های متعددی در این باره چاپ نموده اند، چرا که استفاده از...

15 صفحه اول

آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

Video text detection plays an important role in applications such as semantic-based video analysis, text information retrieval, archiving and so on. In this paper, we propose a Farsi/Arabic text detection approach. First, with an appropriate edge detector, edges are extracted and then by using edges cross ponts, artificial corners are extracted. Artificial corner histogram analysis is done for ...

full text

ردیابی وسیله نقلیه در دنباله تصاویر ویدیویی با وجود هم پوشانی

یکی از مسائل مهم و قابل توجه در سیستم های هوشمند و بینایی ماشین ردیابی اهداف است. هدف ما در این پایان نامه رهگیری مقاوم و موثر خودروهای مشاهده شده از دنباله تصاویر گرفته شده توسط دوربین ثابت است. شناسایی اهداف اولین مرحله در الگوریتم های ردیابی است. بدین منظور از روش های تفاضل پس زمینه استفاده نموده ایم. برای مدل کردن پس زمینه از روش های تفاضل فریم ها و تفاضل زمینه استفاده شده است. پس از به دست...

15 صفحه اول

آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

استخراج اطلاعات متنی از تصاویر ویدیویی نقش مهمی را در کاربردهایی نظیر تحلیل معنایی ویدیو، بازیابی اطلاعات متنی، آرشیو تصاویر ویدیویی و اطلاعات مربوطه ایفا می کند. در این مقاله روشی جهت استخراج متن فارسی- عربی از تصاویر ویدیویی ارائه می گردد. در ابتدا با استفاده از آشکارساز لبه مناسب، لبه های موجود در تصویر استخراج گردیده و با استفاده از مکان تلاقی لبه ها، گوشه های تصنعی موجود در تصویر مشخص می ش...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی (نوشیروانی) بابل - دانشکده برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023